code.jpg

上图转自新浪微博:“阿里代码库有几亿行代码,但其中有很多功能重复的代码,比如单单快排就被重写了几百遍。请设计一个程序,能够将代码库中所有功能重复的代码找出。各位大佬有啥想法,我当时就懵了,然后就挂了。。。”

这里我们把问题简化一下:首先假设两个功能模块如果接受同样的输入,总是给出同样的输出,则它们就是功能重复的;其次我们把每个模块的输出都简化为一个整数(在 int 范围内)。于是我们可以设计一系列输入,检查所有功能模块的对应输出,从而查出功能重复的代码。你的任务就是设计并实现这个简化问题的解决方案。

输入格式:

输入在第一行中给出 2 个正整数,依次为 N(≤104)和 M(≤102),对应功能模块的个数和系列测试输入的个数。

随后 N 行,每行给出一个功能模块的 M 个对应输出,数字间以空格分隔。

输出格式:

首先在第一行输出不同功能的个数 K。随后 K 行,每行给出具有这个功能的模块的个数,以及这个功能的对应输出。数字间以 1 个空格分隔,行首尾不得有多余空格。输出首先按模块个数非递增顺序,如果有并列,则按输出序列的递增序给出。

注:所谓数列 { A1​, …, AM​ } 比 { B1​, …, BM​ } 大,是指存在 1≤i<M,使得 A1​=B1​,…,Ai​=Bi​ 成立,且 Ai+1​>Bi+1​。

输入样例:

1
2
3
4
5
6
7
8
7 3
35 28 74
-1 -1 22
28 74 35
-1 -1 22
11 66 0
35 28 74
35 28 74

输出样例:

1
2
3
4
5
4
3 35 28 74
2 -1 -1 22
1 11 66 0
1 28 74 35

思路

基本思路:记录每种数组出现的个数,并按照非递增顺序输出;如果个数相同,按照数组序列递增输出。

记录每种数组出现的个数可以使用map容器,其中键值key为动态数组vector<int>,value为int;定义一个结构体数组vec,存放每种数组及其出现的次数,进行排序输出即可。

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
#include <iostream>
#include <map>
#include <vector>
#include <algorithm>
using namespace std;
struct node{
vector<int> v;
int cnt;
};
bool cmp(node a, node b) {
if(a.cnt != b.cnt) return a.cnt > b.cnt;
return a.v < b.v;
}
int main() {
int n, m;
cin >> n >> m;
getchar();
map<vector<int>, int> mp;
for(int i = 0; i < n; i++) {
vector<int> v;
for(int j = 0; j < m; j++) {
int t;
cin >> t;
v.push_back(t);
}
mp[v]++;
}
vector<node> vec;
for(auto it = mp.begin(); it != mp.end(); it++) {
node tmp;
tmp.cnt = it->second;
tmp.v = it->first;
vec.push_back(tmp);
}
sort(vec.begin(), vec.end(), cmp);
cout << vec.size() << endl;
for(int i = 0; i < vec.size(); i++) {
cout << vec[i].cnt;
for(int j = 0; j < vec[i].v.size(); j++) cout << " " << vec[i].v[j];
cout << endl;
}
}